label {
font-family: Heebo, Arial, sans-serif;
font-weight: bold;
}
סמנו ב-✔, או בטלו את הסימון, כדי להראות/להחביא את החלקים השונים:הגדרותמשפטיםהוכחותדוגמאות
כל פקודה תתחיל ב-MKגדולות עש מיכאל קלי (Michael Kali), וזאת משתי סיבות:
כדי שבטבלת הקיצורים שבתוך \SpecialChar LyX תופענה כל הפקודות זו לצד זו.
הבחירה דווקא באותיות גדולות נועדה לוודא שהפקודות אינן מתנגשות עם פקודות \SpecialChar LaTeX מקוריות.
על הפקודות להיות קצרות ככל האפשר, וזאת כדי לאפשר את כתיבתן במהירות מבלי ליצור להן קיצור מקלדת. הסיבה לכך שלא ניצור קיצור מקלדת לכל פקודה היא שפעמים רבות ניצור פקודות שתיועדנה למקרים מסוימים מאוד, ואז יעבור זמן רב עד שנשתמש בקיצור המקלדת בפעם הבאה ולכן לא נזכור אותו - הרבה יותר פשוט לזכור את הפקודה שיצרנו מכיוון שיש לה תוכן אמיתי שקשור לפלט הרצוי מן הפקודה. סיבה נוספת היא שיצירת קיצור מקלדת לכל פקודה ולו החריגה ביותר תקשה עלינו ליצור קיצורי מקלדת לפקודות חשובות יותר. לפיכך פקודות שימושיות מאוד שבוודאי ניצור להן קיצור מקלדת ונשתמש בו פעמים רבות אינן צריכות להיות קצרות.
כדי להקל על כתיבת פקודות שלא יצרתי להן קיצור מקלדת כתבתי קיצור מקלדת שיוצר את הקידומת של כל פקודות ה-macrosשלי ואז כל מה שנותר הוא להקיש שלוש-ארבע אותיות כדי לבחור את הפקודה הרצויה, קיצור המקלדת המדובר הוא "Ctrl+k".
לכל גופן יש קידומת בת שתי אותיות.
\(\:\)
\(\:\)קבוצות ופונקציות לפי קורסיםLatexCommand ruleoffset "0.5ex"width "100col%"height "1pt"\(\:\)
\(\:\)המספרים המרוכבים ופונקציות מרוכבות\(\:\)
\(\newcommand{\MKcis}{\text{cis}}\)\(\cos+i\cdot\sin\). המספרים המרוכבים.
\(\newcommand{\MKre}{\text{Re}}\)החלק הממשי של מספר מרוכב. המספרים המרוכבים.
\(\newcommand{\MKim}{\text{Im}}\)החלק המדומה של מספר מרוכב. המספרים המרוכבים.מופיע גם כתמונה של פונקציה.
\(\newcommand{\MKbigcupdot}{\bigsqcup}\)איחוד זר גדול
הקוד שלהלן מייצר את הסימון לאיחוד זר כסימן של איחוד רגיל עם נקודה בתוכו. הקוד מבוסס על זה שמופיע בתגובה הרביעית שבשרשור הזה: https://tex.stackexchange.com/questions/3964/mathematical-symbol-for-disjoint-set-union.
\(\:\)גופןmathcal: בסיסים, קבוצת חזקה, העתקות גלואה, המילטוניאן ועוד\(\:\)
\(\newcommand{\MKcla}{\mathcal{A}}\)
\(\newcommand{\MKclb}{\mathcal{B}}\)
\(\newcommand{\MKclc}{\mathcal{C}}\)
\(\newcommand{\MKcld}{\mathcal{D}}\)
\(\newcommand{\MKcle}{\mathcal{E}}\)
\(\newcommand{\MKclf}{\mathcal{F}}\)
\(\newcommand{\MKclg}{\mathcal{G}}\)
\(\newcommand{\MKclh}{\mathcal{H}}\)
\(\newcommand{\MKcli}{\mathcal{I}}\)
\(\newcommand{\MKclj}{J}\)
\(\newcommand{\MKclk}{\mathcal{K}}\)
\(\newcommand{\MKcll}{\mathcal{L}}\)
\(\newcommand{\MKclm}{\mathcal{M}}\)
\(\newcommand{\MKcln}{\mathcal{N}}\)
\(\newcommand{\MKclo}{\mathcal{O}}\)
\(\newcommand{\MKclp}{\mathcal{P}}\)
\(\newcommand{\MKclq}{\mathcal{Q}}\)
\(\newcommand{\MKclr}{\mathcal{R}}\)
\(\newcommand{\MKcls}{\mathcal{S}}\)
\(\newcommand{\MKclt}{\mathcal{T}}\)
\(\newcommand{\MKclu}{\mathcal{U}}\)
\(\newcommand{\MKclv}{\mathcal{V}}\)
\(\newcommand{\MKclw}{\mathcal{W}}\)
\(\newcommand{\MKclx}{\mathcal{X}}\)
\(\newcommand{\MKcly}{\mathcal{Y}}\)
\(\newcommand{\MKclz}{\mathcal{Z}}\)
\(\:\)גופןmathscr: ?\(\:\)
\(\newcommand{\MKsrb}{\mathscr{B}}\)
\(\newcommand{\MKsrf}{\mathscr{F}}\)
\(\:\)גופןmathfrak: אותיות גותיות לעוצמות\(\:\)
\(\newcommand{\MKfka}{\mathfrak{a}}\)
\(\newcommand{\MKfkb}{\mathfrak{b}}\)
\(\newcommand{\MKfkc}{\mathfrak{c}}\)
\(\:\)כתיבת סדרות במהירותLatexCommand ruleoffset "0.5ex"width "100col%"height "1pt"\(\:\)
\(\newcommand{\MKseq}[3]{#1_{1}#2#1_{2}#2\ldots#2#1_{#3}}\)תודה למיכאל קלי שכתב את הפקודה.
\(\newcommand{\MKseqz}[3]{#1_{0}#2#1_{1}#2\ldots#2#1_{#3}}\)תודה למיכאל קלי שכתב את הפקודה.
\(\newcommand{\MKdseq}[5]{#1_{1}#2#3_{1}#4#1_{2}#2#3_{2}#4\ldots#1_{#5}#2#3_{#5}}\)תודה למיכאל קלי שכתב את הפקודה.
\(\newcommand{\MKdseqz}[5]{#1_{0}#2#3_{0}#4#1_{1}#2#3_{1}#4\ldots#1_{#5}#2#3_{#5}}\)תודה למיכאל קלי שכתב את הפקודה.
1 התחלה
1.1 הגדרות
גם בפרק זה אנחנו נעסוק רק בפונקציות מהצורה \(f:D\rightarrow\MKreal\) כאשר \(D\subseteq\MKreal^{n}\) ולכן לא אטרח לציין זאת בכל פעם.
אינטואיציה:
ראינו באינפי'1 שקיום הגבול: \(\begin{alignedat}{1}\begin{alignedat}{1}\lim_{h\rightarrow0}\frac{f\left(x_{0}+h\right)-f\left(x_{0}\right)}{h}\end{alignedat}
\end{alignedat}
\) שקול לגזירות של \(f\) ב-\(x_{0}\) ושאם הגבול אכן קיים אז הוא שווה ל-\(f'\left(x_{0}\right)\).
\(\clubsuit\)
קל יותר לעבוד עם ההגדרה הזו כש-\(\vec{u}\) הוא וקטור יחידה ואכן יש המגדירים נגזרת כיוונית רק עבור וקטור יחידה, בקורס שלנו קיבלנו את שתי ההגדרות ולכן נתתי את הכללית מביניהן.
\(\clubsuit\)
נגדיר \(h\left(t\right)=f\left(P+t\cdot\vec{u}\right)-f\left(P\right)\) ונניח ש-\(\vec{u}\) הוא וקטור יחידה1אם אינו כזה אפשר לנרמל אותו לפני כן או לחלק בנורמה שלו אח"כ במקום לחלק ב-\(1\) כפי שדורש כלל לופיטל (שהרי הנגזרת של המכנה היא \(\left\Vert \vec{u}\right\Vert \))., מכלל לופיטל נובע שאם לנגזרת של \(h\) יש גבול ב-\(0\) אז הנגזרת \(D_{\vec{u}}f\left(P\right)\) קיימת ושווה לגבול זה (שבד"כ הוא גם הנגזרת של \(h\) ב-\(0\) כי \(h'\) רציפה ב-\(0\)). נשים לב: בניגוד לרעיון המגוחך להפעיל את כלל לופיטל על הגדרת הנגזרת2הגבול \(\lim_{x\rightarrow a}\frac{f\left(x\right)-f\left(a\right)}{x-a}\) קיים אם הגבול של \(f'\) ב-\(a\) קיים, זהו רעיון מגוחך מפני שאנחנו לא יודעים ש-\(f'\) מוגדרת בכלל, את זה אנחנו מנסים להוכיח. כאן פעמים רבות אנחנו כבר נכיר את הנגזרת של \(h\) כי כבר מצאנו אותה בעבודה קשה באינפי'1ולכן אנחנו יכולים להקל על עצמנו את החיים.
\(\clubsuit\)
אפשרות נוספת שראינו בהרצאה היא להגדיר \(h\left(t\right)=f\left(P+t\cdot\vec{u}\right)\) ואז אם \(\vec{u}\) הוא וקטור יחידה יתקיים (מדובר בשוויון פורמלי בלבד):\[
\lim_{t\rightarrow0}\frac{f\left(P+t\cdot\vec{u}\right)-f\left(P\right)}{\left\Vert \vec{u}\right\Vert \cdot t}=\lim_{t\rightarrow0}\frac{h\left(t\right)-h\left(0\right)}{t}=h'\left(0\right)
\]אני מודה שהאפשרות הזו קלה הרבה יותר ליישום, אבל משום מה כשלמדנו אותה מה שעבר לי בראש הוא דווקא האפשרות הראשונה עד שגלעד שילה העמיד אותי על טעותי...
אינטואיציה:
למדנו באינפי'1גם את המשפט הבא: תהא \(f\) פונקציה רציפה בנקודה \(x_{0}\in\MKreal\), \(f\) גזירה ב-\(x_{0}\) אם"ם קיימים \(a,b\in\MKreal\) כך שמתקיים (קיום הגבול וערכו):\[
\lim_{x\rightarrow x_{0}}\frac{f\left(x\right)-\left(ax+b\right)}{x-x_{0}}=0
\]ובמקרה כזה מתקיים \(f'\left(x_{0}\right)=a\) ו-\(b=f\left(x_{0}\right)-f'\left(x_{0}\right)\cdot x_{0}\). מהמשפט הזה נובע שפונקציה \(g\) גזירה בנקודה \(x_{0}\in\MKreal\) אם"ם קיים \(m\in\MKreal\) כך שמתקיים (קיום הגבולות וערכם):\[
\lim_{h\rightarrow0}\frac{g\left(x_{0}+h\right)-g\left(x_{0}\right)-m\cdot h}{h}=\lim_{x\rightarrow x_{0}}\frac{g\left(x\right)-\left(g\left(x_{0}\right)+m\cdot\left(x-x_{0}\right)\right)}{x-x_{0}}=0
\]
\(\clubsuit\)
ממש כפי שהביטויים "\(g\left(x\right)-\left(g\left(x_{0}\right)+m\left(x-x_{0}\right)\right)\)" ו-"\(g\left(x_{0}+h\right)-g\left(x_{0}\right)-m\cdot h\)" ביטאו את המרחק של הפונקציה מהישר המשיק לה בנקודה \(x_{0}\), הביטוי "\(f\left(P+\vec{h}\right)-f\left(P\right)-L\left(\vec{h}\right)\)" הוא המרחק בין הפונקציה לישריה המשיקה לה; כלומר כמו ש-\(m\cdot h\) מגדיר ישר העובר בראשית הצירים שכאשר מוסיפים לו את \(g\left(x_{0}\right)\) מקבלים ישר שאינו עובר בהכרח בראשית הצירים אך משיק לגרף של \(g\) ב-\(x_{0}\), כך גם הגרף של \(L\) הוא תת-מרחב וקטורי (של \(\MKreal^{n+1}\)!) שכאשר מוסיפים לו את \(f\left(P\right)\) מקבלים ישריה המשיקה לגרף של \(f\) ב-\(P\).
\(\clubsuit\)
ההגדרה הזו עובדת גם כאשר הטווח של \(f\) הוא \(\MKreal^{m}\) עבור \(m>1\) (אלא שאז גם הטווח של \(L\) צריך להיות \(\MKreal^{m}\)); ואז הגדרת הדיפרנציאביליות של פונקציות מהצורה \(f:D\rightarrow\MKreal^{m}\) (כאשר \(D\subseteq\MKreal^{n}\)) כוללת בתוכה גם את ההגדרה האחרונה וגם את הגדרת הגזירות של מסילות, ומוסיפה על אלו את כל הפונקציות שעבורן \(n,m>1\).
\(\clubsuit\)
\(M\) היא הישריה שדיברנו עליה בהערה הקודמת.
\(\clubsuit\)
האמת שזה קצת מצחיק לייצג העתקה ליניארית ע"י מכפלה סקלרית בווקטור אחרי שכבר הגדרנו מהי מטריצה מייצגת של העתקה ליניארית ע"פ בסיס נתון, אבל אין הבדל בין כפל מטריצת שורה (או וקטור שורה) בווקטור עמודה לבין מכפלה סקלרית.
\(\clubsuit\)
הגרדיאנט מוגדר רק עבור פונקציות מהצורה \(f:\MKreal^{n}\rightarrow\MKreal\) מפני שעבור פונקציות מהצורה \(f:\MKreal^{n}\rightarrow\MKreal^{m}\) כאשר \(m>1\) המטריצה המייצגת של הדיפרנציאל השלם חייבת להיות בעלת יותר משורה אחת ולכן אי אפשר להחליף את הכפל בה במכפלה סקלרית של וקטורים.
\(\clubsuit\)
נניח בהג"כ ש-\(\theta\in\left[0,\pi\right]\), המסקנה הזו מספרת לנו שהכיוון שבו העליה מהנקודה היא התלולה ביותר הוא הכיוון עליו מצביע הגרדיאנט (כאשר \(\theta=0\)), הכיוון שבו הירידה היא המהירה ביותר הוא בכיוון הנגדי (כאשר \(\theta=\pi\)) והכיוונים הניצבים להם (כאשר \(\theta=\frac{\pi}{2}\)) הם אלו שבהם לא נעלה ולא נרד. ובכלל: בכיוונים שעבורם \(\frac{\pi}{2}>\theta\) הנגזרת הכיוונית תהיה חיובית (עליה) כאשר השיא הוא עבור \(\theta=0\), ובכיוונים שעבורם \(\frac{\pi}{2}<\theta\) הנגזרת הכיוונית תהיה שלילית (ירידה) כאשר השיא הוא עבור \(\theta=\pi\).
\(\clubsuit\)
הכיוון ההפוך אינו נכון, נביא דוגמה נגדית. תהא \(f:\MKreal^{2}\rightarrow\MKreal\) המוגדרת ע"י (לכל \(\left(x,y\right)\in\MKreal^{2}\)):\[
f\begin{pmatrix}x\\
y
\end{pmatrix}:=\begin{cases}
\left(x^{2}+y^{2}\right)\cdot\sin\left(\frac{1}{\sqrt{x^{2}+y^{2}}}\right) & \left(x,y\right)\neq\left(0,0\right)\\
0 & \left(x,y\right)=\left(0,0\right)
\end{cases}
\]הגרף של הפונקציה הזו הוא סיבוב של גרף הפונקציה 'סינוס "משוגעת" - הכפלה ב-\(x^{2}\)' (ראו בקובץ "מאגר פונקציות פתולוגיות") ולכן נדע שהנגזרות החלקיות שלה אינן רציפות בראשית הצירים אבל למרות זאת היא דיפרנציאבילית.
\(\clubsuit\)
נניח בהג"כ ש-\(\theta\in\left[0,\pi\right]\), המסקנה הזו מספרת לנו שהכיוון שבו העליה מהנקודה היא התלולה ביותר הוא הכיוון עליו מצביע הגרדיאנט (כאשר \(\theta=0\)), הכיוון שבו הירידה היא המהירה ביותר הוא בכיוון הנגדי (כאשר \(\theta=\pi\)) והכיוונים הניצבים להם (כאשר \(\theta=\frac{\pi}{2}\)) הם אלו שבהם לא נעלה ולא נרד. ובכלל: בכיוונים שעבורם \(\frac{\pi}{2}>\theta\) הנגזרת הכיוונית תהיה חיובית (עליה) כאשר השיא הוא עבור \(\theta=0\), ובכיוונים שעבורם \(\frac{\pi}{2}<\theta\) הנגזרת הכיוונית תהיה שלילית (ירידה) כאשר השיא הוא עבור \(\theta=\pi\).
הגדרה 1.1. נגזרת כיוונית תהא \(f\) פונקציה המוגדרת בסביבה מלאה של נקודה \(P\in\MKreal^{n}\) ויהי \(\vec{0}\neq\vec{u}\in\MKreal^{n}\) וקטור. נאמר ש-\(f\) גזירה בנקודה \(P\) בכיוון \(\vec{u}\) אם קיים הגבול:\[
\lim_{t\rightarrow0}\frac{f\left(P+t\cdot\vec{u}\right)-f\left(P\right)}{\left\Vert \vec{u}\right\Vert \cdot t}
\]ואם אכן קיים הגבול אז נאמר שהוא הנגזרת של \(f\) ב-\(P\)בכיוון\(\vec{u}\) ונסמן אותו ב-\(D_{\vec{u}}f\left(P\right)\) או ע"י \(\frac{\partial f}{\partial\vec{u}}\left(P\right)\), אם \(\vec{u}\) הוא אחד מווקטורי הבסיס הסטנדרטי נסמן את הנגזרת הכיוונית גם ב-\(D_{i}f\left(P\right)\)3סימון נוסף שראינו היה \(f_{x}'\) עבור \(D_{1}f\) ו-\(f_{y}'\) עבור \(D_{2}f\). עבור \(e_{i}\) (לכל \(n\geq i\in\MKnatural\)) ונקרא לה הנגזרת החלקית של \(f\)בכיוון המשתנה ה-\(i\)4שימושי בשניים או שלושה ממדים שאז נקרא לנגזרת "הנגזרת החלקית בכיון ציר ה-\(x\)/\(y\)/\(z\)"..
הגדרה 1.2. דיפרנציאביליות תהא \(f\) פונקציה המוגדרת בסביבה מלאה של נקודה \(P\in\MKreal^{n}\), נאמר ש-\(f\)דיפרנציאבילית ב-\(P\) אם קיימת העתקה ליניארית \(L:\MKreal^{n}\rightarrow\MKreal\) המקיימת:\[
\lim_{\left\Vert \vec{h}\right\Vert \rightarrow0}\frac{f\left(P+\vec{h}\right)-f\left(P\right)-L\left(\vec{h}\right)}{\left\Vert \vec{h}\right\Vert }=0
\]
למה 1.3. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\), קיימת העתקה ליניארית \(L:\MKreal^{n}\rightarrow\MKreal\) יחידה המקיימת את הגדרת הדיפרנציאביליות.
הגדרה 1.4. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\) ותהא \(L\) ההעתקה הליניארית המתאימה, נסמן את \(L\) ע"י \(D_{f}\left(P\right)\)5יש המסמנים להיפך \(D_{P}\left(f\right)\). או ב-\(Df\left(P\right)\) ונקרא לה הדיפרנציאל השלם של \(f\) ב-\(P_{0}\).
הגדרה 1.5. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P:=\left(x_{1},x_{2},\ldots,x_{n}\right)\in\MKreal^{n}\), הישריה המוגדרת ע"י \(M:=\left\{ \left(x_{1},x_{2},\ldots,x_{n},f\left(P\right)\right)\right\} +\text{Graph}\left(D_{f}\left(P\right)\right)\) תקרא הישריה המשיקה לגרף של \(f\) ב-\(P\).
משפט 1.6. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\), \(D_{f}\left(P\right)\) היא ההעתקה הליניארית המוגדרת ע"י (לכל \(\left(x_{1},x_{2},\ldots,x_{n}\right)\in\MKreal^{n}\)):\[
D_{f}\left(P\right)\begin{pmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{n}
\end{pmatrix}:=\sum_{i=1}^{n}D_{i}f\left(P_{0}\right)\cdot x_{i}=\begin{bmatrix}D_{1}f\left(P\right)\\
D_{2}f\left(P\right)\\
\vdots\\
D_{n}f\left(P\right)
\end{bmatrix}\cdot\begin{pmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{n}
\end{pmatrix}
\]
הגדרה 1.7. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\), הגרדיאנט של \(f\) ב-\(P_{0}\) הוא הווקטור:\[
\overrightarrow{\nabla}f\left(P\right):=\overrightarrow{\text{grad}}f\left(P\right):=\begin{bmatrix}D_{1}f\left(P\right)\\
D_{2}f\left(P\right)\\
\vdots\\
D_{n}f\left(P\right)
\end{bmatrix}
\]א"כ לכל \(\vec{v}\in\MKreal^{n}\) מתקיים \(\left(D_{f}\left(P\right)\right)\left(\vec{v}\right)=\overrightarrow{\nabla}f\left(P\right)\cdot\vec{v}\).
משפט. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\) ויהי \(\vec{u}\) וקטור יחידה, מתקיים \(D_{\vec{u}}f\left(P\right)=\left(D_{f}\left(P\right)\right)\left(\vec{u}\right)\), כלומר הדיפרנציאל השלם של \(\vec{u}\) הוא הנגזרת הכיוונית בכיוון \(\vec{u}\).
מסקנה. לכל וקטור יחידה \(\vec{u}\in\MKreal^{n}\) מתקיים (תהא \(\theta\in\MKreal\) זווית שבין \(\vec{u}\) ל-\(\overrightarrow{\nabla}f\left(P\right)\)):\[\begin{align*}
D_{\vec{u}}f\left(P\right) & =\overrightarrow{\nabla}f\left(P\right)\cdot\vec{u}=\left\Vert \overrightarrow{\nabla}f\left(P\right)\right\Vert \cdot\left\Vert \vec{u}\right\Vert \cdot\cos\theta\\
& =\left\Vert \overrightarrow{\nabla}f\left(P\right)\right\Vert \cdot1\cdot\cos\theta=\left\Vert \overrightarrow{\nabla}f\left(P\right)\right\Vert \cdot\cos\alpha
\end{align*}\]
\(\:\)
גם בפרק זה אנחנו נעסוק רק בפונקציות מהצורה \(f:D\rightarrow\MKreal\) כאשר \(D\subseteq\MKreal^{n}\) ולכן לא אטרח לציין זאת בכל פעם.
טענה 1.8. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\), \(f\) גם רציפה ב-\(P\).
משפט 1.9. תהא \(f\) פונקציה מוגדרת בסביבה מלאה של נקודה \(P\in\MKreal^{n}\), אם כל הנגזרות החלקיות של \(f\) רציפות ב-\(P\)6ובפרט מוגדרות בסביבה מלאה שלה. אז \(f\) דיפרנציאבילית ב-\(P\).
משפט 1.10. תהא \(f\) פונקציה דיפרנציאבילית בנקודה \(P\in\MKreal^{n}\) ויהי \(\vec{u}\) וקטור יחידה, מתקיים \(D_{\vec{u}}f\left(P\right)=\left(D_{f}\left(P\right)\right)\left(\vec{u}\right)\), כלומר הדיפרנציאל השלם של \(\vec{u}\) הוא הנגזרת הכיוונית בכיוון \(\vec{u}\).
מסקנה 1.11. לכל וקטור יחידה \(\vec{u}\in\MKreal^{n}\) מתקיים (תהא \(\theta\in\MKreal\) זווית שבין \(\vec{u}\) ל-\(\overrightarrow{\nabla}f\left(P\right)\)):\[\begin{align*}
D_{\vec{u}}f\left(P\right) & =\overrightarrow{\nabla}f\left(P\right)\cdot\vec{u}=\left\Vert \overrightarrow{\nabla}f\left(P\right)\right\Vert \cdot\left\Vert \vec{u}\right\Vert \cdot\cos\theta\\
& =\left\Vert \overrightarrow{\nabla}f\left(P\right)\right\Vert \cdot1\cdot\cos\theta=\left\Vert \overrightarrow{\nabla}f\left(P\right)\right\Vert \cdot\cos\alpha
\end{align*}\]
2 דיפרנציאביליות ונקודות קיצון
2.1 הגדרות
גם בפרק זה אנחנו נעסוק רק בפונקציות מהצורה \(f:D\rightarrow\MKreal\) כאשר \(D\subseteq\MKreal^{n}\) ולכן לא אטרח לציין זאת בכל פעם.
\(\clubsuit\)
ההגדרה של נקודות קיצון (כלליות ומקומיות) מופיעה בקובץ על סדרות ופונקציות.
\(\clubsuit\)
הרעיון הוא כמו באינפי'1: נקודות קריטיות ונקודות סינגולריות הן היחידות שעלולות להיות נקודות קיצון.
\(\clubsuit\)
נקודת אוכף היא המקבילה של נקודת פיתול שבה הנגזרת מתאפסת, השם נובע מצורת ה"אוכף" שנוצרת במקרה כזה (להמחשה לחצו כאן).
\(\clubsuit\)
מדובר בסימון בלבד, אף אחד לא מבטיח לנו שהביטוי מוגדר בכלל.
\(\clubsuit\)
הנגזרות הנ"ל הן נגזרות חלקיות מעורבות מסדר שני, אפשר להמשיך ולגזור גם אותן ולקבל נגזרות מעורבות מסדר שלישי: \(D_{ijk}f\left(P\right):=D_{i}\left(D_{jk}f\left(P\right)\right)=D_{i}\left(D_{j}\left(D_{k}f\right)\left(P\right)\right)\), וכן עבור נגזרות מעורבות מסדר רביעי וכו'.
אינטואיציה:
באינפי'1ראינו שהציפייה מפולינום שצריך לקרב את פונקציה גזירה בנקודה היא ש"יסכים" עם הפונקציה על כל הנגזרות באותה נקודה עד לסדר מסוים, האם ניתן לבצע זאת גם עבור פונקציות מ-\(\MKreal^{2}\) ל-\(\MKreal\)? נזכור שאת הפולינום מסדר ראשון כבר ראינו, זהו הדיפרנציאל השלם של הפונקציה בנקודה, אבל כיצד נראה פולינום טיילור מסדר שני?
\(\clubsuit\)
הייתי רוצה להביא כאן את ההגדרה הכללית של פולינום טיילור מסדר \(n\) אבל התאפקתי מלעשות זאת (ראוי להערכה, לא?) מפני שהנושא שלנו הוא מיון נקודות קריטיות באמצעות הנגזרות החלקיות מסדר שני ולא פולינום טיילור.
\(\clubsuit\)
נשים לב שמהגדרה "פולינום" זה אכן מקיים את מה שציפינו לו, הוא "מסכים" עם \(f\) על כל הנגזרות החלקיות מסדר ראשון ומסדר שני בנקודה \(P_{0}\).
\(\clubsuit\)
אם \(P_{0}\) היא נקודה קריטית אז מתקיים:\[
T_{2,f,P_{0}}\begin{pmatrix}x\\
y
\end{pmatrix}=f\left(P_{0}\right)+\frac{1}{2}\cdot\left(A\left(x-x_{0}\right)^{2}+2B\left(x-x_{0}\right)\left(y-y_{0}\right)+C\left(y-y_{0}\right)^{2}\right)
\]ואז השאלה אם \(P_{0}\) היא נקודת מקסימום/מינימום של \(T_{2,f,P_{0}}\begin{pmatrix}x\\
y
\end{pmatrix}\) תלויה בשאלה אם קיימת סביבה שבה המחובר השני חיובי/שלילי (אם אין סביבה כזו זוהי נקודת אוכף) ומכיוון שבסביבה מספיק קטנה \(f\) מתנהגת בצורה דומה ל-\(T_{2,f,P_{0}}\)7את זה מראה המשפט הבא, ראו את ההסבר בקובץ הטענות. נדע ש-\(P_{0}\) היא נקודת מקסימום/מינימום/אוכף של \(f\) אם"ם היא נקודת מקסימום/מינימום/אוכף של \(T_{2,f,P_{0}}\).
נשים לב שאם הנגזרות החלקיות מסדר ראשון של \(f\) ב-\(P_{0}\) דיפרנציאביליות אז השורה ה-\(i\) ב-\(H\) היא השחלוף של הגרדיאנט של \(D_{i}f\) ב-\(P_{0}\), ואם הנגזרות החלקיות מסדר שני של \(f\) ב-\(P_{0}\) רציפות אז מהלמה של שוורץ נובע ש-\(H\) סימטרית ולכן לכסינה ומכאן שיש לה ערכים עצמיים.
\(\clubsuit\)
משפט שוורץ נכון לכל שתי נגזרות כיווניות ולאו דווקא כאלה המקבילות לצירים.
\(\clubsuit\)
דוגמה לכך שהמשפט אינו נכון אם הנגזרות המעורבות אינן רציפות בנקודה היא הפונקציה \(f:\MKreal^{2}\rightarrow\MKreal\) המוגדרת ע"י:\[
f\begin{pmatrix}x\\
y
\end{pmatrix}:=\begin{cases}
\frac{x^{3}y-xy^{3}}{x^{2}+y^{2}} & \left(x,y\right)\neq\left(0,0\right)\\
0 & \left(x,y\right)=\left(0,0\right)
\end{cases}
\]אם נחשב את הנגזרות המעורבות בראשית הצירים נקבל \(D_{12}f\left(0,0\right)=1\neq-1=D_{21}f\left(0,0\right)\).
הגדרה 2.1. נקודות קריטיות וסינגולריות תהא \(f\) פונקציה, נקודה פנימית \(P\in\MKreal^{n}\) בתחום ההגדרה תיקרא נקודה קריטית אם כל הנגזרות החלקיות מתאפסות בה, ותיקרא נקודה סינגולרית אם אחת הנגזרות החלקיות אינה מוגדרת בה.
הגדרה 2.2. נקודת אוכף תהא \(f\) פונקציה, נקודה \(P\in\MKreal^{n}\) בתחום ההגדרה תקרא נקודת אוכף אם כל הנגזרות החלקיות מתאפסות בה אך היא אינה נקודת קיצון.
הגדרה 2.3. נגזרות חלקיות מעורבות תהא \(f\) פונקציה, לכל \(n\geq i,j\in\MKnatural\) ולכל \(P\in\MKreal^{n}\) נקודה בתחום ההגדרה נסמן \(D_{ij}f\left(P\right):=D_{i,j}f\left(P\right):=D_{i}\left(D_{j}f\right)\left(P\right)\).
הגדרה 2.4. תהא \(U\subseteq\MKreal^{2}\) ותהא \(f:U\rightarrow\MKreal\) פונקציה המקיימת שכל הנגזרות החלקיות שלה מסדר שני בנקודה \(P_{0}:=\left(x_{0},y_{0}\right)\in U\) רציפות ב-\(P_{0}\)8שאז \(f\) דיפרנציאבילית ב-\(P_{0}\) ומתקיים \(D_{12}f\left(P_{0}\right)=D_{21}f\left(P_{0}\right)\)., נסמן:\[
A:=D_{11}f\left(P_{0}\right),\ B:=D_{12}f\left(P_{0}\right)=D_{21}f\left(P_{0}\right),\ C:=D_{22}f\left(P_{0}\right)
\]ואז פולינום טיילור מסדר שני של \(f\) ב-\(P_{0}\) הוא הפונקציה \(T_{2,f,P_{0}}:\MKreal^{2}\rightarrow\MKreal\) המוגדרת ע"י (לכל \(\left(x,y\right)\in\MKreal^{2}\)):\[\begin{align*}
T_{2,f,P_{0}}\begin{pmatrix}x\\
y
\end{pmatrix} & =f\left(P_{0}\right)+D_{1}f\left(P_{0}\right)\cdot\left(x-x_{0}\right)+D_{2}f\left(P_{0}\right)\cdot\left(y-y_{0}\right)+\frac{A}{2}\left(x-x_{0}\right)^{2}+B\left(x-x_{0}\right)\left(y-y_{0}\right)+\frac{C}{2}\left(y-y_{0}\right)^{2}\\
& =f\left(P_{0}\right)+D_{1}f\left(P_{0}\right)\cdot\left(x-x_{0}\right)+D_{2}f\left(P_{0}\right)\cdot\left(y-y_{0}\right)+\frac{1}{2}\cdot\left(A\left(x-x_{0}\right)^{2}+2B\left(x-x_{0}\right)\left(y-y_{0}\right)+C\left(y-y_{0}\right)^{2}\right)
\end{align*}\]
משפט. תהא \(U\subseteq\MKreal^{2}\) ותהא \(f:U\rightarrow\MKreal\) פונקציה המקיימת שכל הנגזרות החלקיות שלה מסדר שני בנקודה \(P_{0}\in U\) רציפות ב-\(P_{0}\), מתקיים:\[
\lim_{P\rightarrow P_{0}}\frac{f\left(P\right)-T_{2,f,P_{0}}\left(P\right)}{\left\Vert P-P_{0}\right\Vert ^{2}}=0
\]
הגדרה 2.5. מטריצת הסיאן תהא \(f\) פונקציה כך שכל הנגזרות החלקיות מסדר שני של \(f\) בנקודה \(P_{0}\in\MKreal^{n}\) מוגדרות, מטריצת הסיאן של \(f\) ב-\(P_{0}\) היא מטריצה \(H\in M_{n}\left(\MKreal\right)\) המוגדרת ע"י \(H_{ij}=D_{ij}f\left(P_{0}\right)\) לכל \(n\geq i,j\in\MKnatural\).
\(\:\)
גם בפרק זה אנחנו נעסוק רק בפונקציות מהצורה \(f:D\rightarrow\MKreal\) כאשר \(D\subseteq\MKreal^{n}\) ולכן לא אטרח לציין זאת בכל פעם.
טענה 2.6. תהא \(f\) פונקציה כך ש-\(P\in\MKreal^{n}\) היא נקודת קיצון מקומית של \(f\), ערכה של כל נגזרת כיוונית של \(f\) ב-\(P\) (אם קיימת כזו) הוא \(0\).
משפט 2.7. משפט פרמה תהא \(f\) פונקציה כך ש-\(P\in\MKreal^{n}\) היא נקודת קיצון מקומית של \(f\), אם \(f\) דיפרנציאבילית ב-\(P\) אז הדיפרנציאל השלם של \(f\) ב-\(P\) הוא העתקת האפס (\(D_{f}\left(P\right)\equiv0\)).
משפט 2.8. משפט שוורץ9ערך בוויקיפדיה הרמן שוורץ.10בשיעור קראנו למשפט זה בשם "הלמה של שוורץ" אך לא מצאתי לכך שום מקור ברשת (בעברית לא מצאתי מקור המזכיר את שם המשפט כלל), את השם "משפט שוורץ" מצאתי בוויקיפדיה האנגלית יחד עם שמות נוספים (ראו כאן). תהא \(f\) פונקציה ותהא \(P\in\MKreal^{n}\) נקודה בתחום ההגדרה, לכל \(n\geq i,j\in\MKnatural\), אם \(D_{ij}f\left(P\right)\) ו-\(D_{ji}f\left(P\right)\) רציפות ב-\(P\)11ובפרט מוגדרות בסביבה מלאה של \(P\). אז הן שוות.
2.2 מיון נקודות קריטיות
משפט 2.9. תהא \(U\subseteq\MKreal^{2}\) ותהא \(f:U\rightarrow\MKreal\) פונקציה המקיימת שכל הנגזרות החלקיות שלה מסדר שני בנקודה \(P_{0}\in U\) רציפות ב-\(P_{0}\), \(T_{2,f,P_{0}}\left(P\right)\) הוא הפולינום היחיד מדרגה קטנה או שווה ל-\(2\) המקיים:\[
\lim_{P\rightarrow P_{0}}\frac{f\left(P\right)-T_{2,f,P_{0}}\left(P\right)}{\left\Vert P-P_{0}\right\Vert ^{2}}=0
\]
\(\clubsuit\)
אם נסמן ב-\(\phi\left(P\right)\) את הביטוי שבתוך הגבול ונגדיר \(\phi\left(P_{0}\right)=0\) נקבל שמתקיים \(f\left(P\right)=T_{2,f,P_{0}}\left(P\right)+\phi\left(P\right)\cdot\left\Vert P-P_{0}\right\Vert ^{2}\) לכל \(P\in U\), כעת נזכור שאם \(P_{0}\) היא נקודה קריטית אז מתקיים12נשתמש באותם סימונים שבקובץ ההגדרות. (לכל \(\left(x,y\right)\in U\)):\[\begin{align*}
T_{2,f,P_{0}}\begin{pmatrix}x\\
y
\end{pmatrix} & =f\left(P_{0}\right)+\frac{1}{2}\cdot\left(A\left(x-x_{0}\right)^{2}+2B\left(x-x_{0}\right)\left(y-y_{0}\right)+C\left(y-y_{0}\right)^{2}\right)\\
\Rightarrow f\begin{pmatrix}x\\
y
\end{pmatrix} & =f\left(P_{0}\right)+\frac{1}{2}\cdot\left(A\left(x-x_{0}\right)^{2}+2B\left(x-x_{0}\right)\left(y-y_{0}\right)+C\left(y-y_{0}\right)^{2}\right)+\phi\left(P\right)\cdot\left\Vert P-P_{0}\right\Vert ^{2}
\end{align*}\]המחובר השלישי שואף ל-\(0\) כשמתקרבים ל-\(P_{0}\) ולכן אם נצליח להוכיח שהמחובר השני (יסומן מעתה ב-\(G\)) מקיים \(0<M<G\) או \(0>-M>G\) (עבור \(0<M\in\MKreal\) כלשהו) בסביבה קטנה מספיק של \(P_{0}\) נוכל לקבוע ש-\(P_{0}\) היא נקודת מינימום/מקסימום מקומית של \(f\) בהתאמה; אחרת, לכל סביבה של \(P_{0}\) המחובר השני מקבל סימנים מנוגדים בנקודות שונות ו-\(P_{0}\) היא נקודת אוכף של \(f\). לכל \(\left(x_{0},y_{0}\right)\neq\left(x,y\right)\in U\) כך ש-\(y=y_{0}\) הסימן של המחובר השני שווה לסימן של \(A\) (עוד מעט נראה למה זה אומר שאין צורך להתייחס למקרה זה באופן מיוחד). לכל \(\left(x_{0},y_{0}\right)\neq\left(x,y\right)\in U\) כך ש-\(y\neq y_{0}\) מתקיים13באותה מידה היה ניתן לדרוש ש-\(x\neq x_{0}\) ולחלק ב-\(x-x_{0}\) ואז התפקידים של \(A\) ו-\(C\) בהמשך יתהפכו.:\[\begin{align*}
& A\left(x-x_{0}\right)^{2}+2B\left(x-x_{0}\right)\left(y-y_{0}\right)+C\left(y-y_{0}\right)^{2}\\
& =\left(y-y_{0}\right)^{2}\cdot\left(A\left(\frac{x-x_{0}}{y-y_{0}}\right)^{2}+2B\left(\frac{x-x_{0}}{y-y_{0}}\right)+C\right)
\end{align*}\]אנחנו יודעים איך מתנהגות פרבולות ולכן נוכל לומר בביטחון שאם הדיסקרימיננטה - \(4B^{2}-4AC=4\left(B^{2}-AC\right)\) - שלילית אז קיים \(0<M\in\MKreal\) כנ"ל שהוא או הנגדי שלו הם הערך של הפרבולה בקודקוד (\(-\frac{2B}{2A}=-\frac{B}{A}\)), ואז אם \(A\) חיובי14כשהדיסקרימיננטה שלילית הסימנים של \(A\) ושל \(C\) שווים אבל ברור למה בחרנו ב-\(A\). נוכל לומר שהפרבולה "מחייכת" (פורמלית: קמורה) ולכן קיימת סביבה קטנה מספיק של \(P_{0}\) שבה \(0<M<G\) ומכאן ש-\(P_{0}\) היא נקודת מינימום, ואם \(A\) שלילי נוכל לומר שהפרבולה "עצובה" (פורמלית: קעורה) ולכן קיימת סביבה כנ"ל שבה מתקיים \(0>-M>G\) ומכאן ש-\(P_{0}\) היא נקודת מקסימום. אחרת, אם הדיסקרימיננטה חיובית אז \(G\) מקבל ערכים חיוביים ושליליים בכל סביבה של \(P_{0}\)15בכל סביבה של \(P_{0}\) קיימות נקודות \(\left(x,y\right)\) בסביבה כך ש-\(\frac{x-x_{0}}{y-y_{0}}\) מקבלות כל מספר ממשי שנרצה. ולכן היא נקודת אוכף. כאשר הדיסקרימיננטה שווה ל-\(0\) כל האפשרויות פתוחות, דוגמאות:
\(x^{4}+y^{4}\), ראשית הצירים היא נקודת מינימום.
\(-\left(x^{4}+y^{4}\right)\), ראשית הצירים היא נקודת מקסימום.
\(x^{4}-y^{4}\), ראשית הצירים היא נקודת אוכף.
לסיכום נראה את המשפט הבא.
משפט 2.10. תהא \(U\subseteq\MKreal^{2}\) ותהא \(f:U\rightarrow\MKreal\) פונקציה כך שהנגזרות החלקיות מסדר ראשון של \(f\) מתאפסות בנקודה \(P_{0}\in U\) וכל הנגזרות החלקיות מסדר שני ב-\(P_{0}\) רציפות ב-\(P_{0}\), נסמן16שימו לב שהסימון הוא הנגדי של הדיסקרימיננטה מההסבר שלעיל, את ההסבר להיפוך נראה בהמשך.:\[\begin{align*}
\Delta & :=D_{11}f\left(P_{0}\right)\cdot D_{22}f\left(P_{0}\right)-D_{12}f\left(P_{0}\right)\cdot D_{21}f\left(P_{0}\right)\\
& =D_{11}f\left(P_{0}\right)\cdot D_{22}f\left(P_{0}\right)-\left(D_{12}f\left(P_{0}\right)\right)^{2}
\end{align*}\]ואז מתקיימים שלושת הפסוקים הבאים17מהגדרה לא ייתכן ש-\(\Delta>0\) ו-\(D_{11}f\left(P_{0}\right)=0\):
אם \(\Delta>0\) ו-\(D_{11}f\left(P_{0}\right)>0\) אז \(P_{0}\) היא נקודת מינימום מקומית של \(f\).
אם \(\Delta>0\) ו-\(D_{11}f\left(P_{0}\right)<0\) אז \(P_{0}\) היא נקודת מקסימום מקומית של \(f\).
אם \(\Delta<0\) אז \(P_{0}\) היא נקודת אוכף של \(f\).
מסקנה 2.11. תהא \(U\subseteq\MKreal^{2}\) ותהא \(f:U\rightarrow\MKreal\) פונקציה כך שהנגזרות החלקיות מסדר ראשון של \(f\) מתאפסות בנקודה \(P_{0}\in U\) וכל הנגזרות החלקיות מסדר שני ב-\(P_{0}\) רציפות ב-\(P_{0}\) ונסמן ב-\(H\) את מטריצת הסיאן של \(f\) ב-\(P_{0}\); מהגדרה \(H\) סימטרית ולכן לכסינה ומכאן שיש לה שני ערכים עצמיים, מתקיימים שלושת הפסוקים הבאים:
אם שניהם חיוביים אז \(P_{0}\) היא נקודת מינימום מקומית של \(f\).
אם שניהם שליליים אז \(P_{0}\) היא נקודת מקסימום מקומית של \(f\).
אם אחד מהם חיובי והאחר שלילי אז \(P_{0}\) היא נקודת אוכף של \(f\).
\(\clubsuit\)
זה אולי נראה כמו קסם אבל יש לזה הסבר אלגברי פשוט מאד. הפולינום האופייני של \(H\) הוא (נשתמש בסימונים שבהערה הקודמת):\[
\left(T-A\right)\left(T-C\right)-B^{2}=T^{2}-\left(A+C\right)T+\left(AC-B^{2}\right)
\]ולכן השורשים שלו הם (שהם הערכים העצמיים של \(H\)):\[
\frac{\left(A+C\right)\pm\sqrt{\left(A+C\right)^{2}-4\left(AC-B^{2}\right)}}{2}
\]ואז:
אם \(\Delta>0\) אז \(\left|A+C\right|>-\sqrt{\left(A+C\right)^{2}-4\left(AC-B^{2}\right)}\geq0\) ולכן הערכים העצמיים בעלי אותו סימן וזהו הסימן של \(A\) ו-\(C\)18כפי שראינו סימיניהם זהים..
אם \(\Delta<0\) אז \(\sqrt{\left(A+C\right)^{2}-4\left(AC-B^{2}\right)}>\left|A+C\right|\) ולכן אחד הערכים העצמיים חיובי והאחר שלילי.
\(\clubsuit\)
ההסבר האמיתי לקשר בין הערכים העצמיים של ההסיאן לבין אפיון נקודה קריטית נעוץ בביטוי:\[
A\left(x-x_{0}\right)^{2}+2B\left(x-x_{0}\right)\left(y-y_{0}\right)+C\left(y-y_{0}\right)^{2}
\]לו היינו מקבלים \(B=0\) היה ברור שהנקודה היא נקודת קיצון אם"ם \(\MKsign A=\MKsign C\) ושהיא מינימום או מקסימום ע"פ האפיון הנ"ל, אבל מה קורה כאשר \(B\neq0\)? כאן צריך לזכור שאין שום דבר מיוחד בבסיס הסטנדרטי, אנחנו פשוט עובדים עם בסיס אחר שייתן לנו \(B=0\), איך אנחנו יודעים שניתן לעשות זאת? מפני שההסיאן סימטרית ולכן לכסינה, לכסון הוא פשוט מעבר לבסיס של וקטורים עצמיים וכאשר נעבור לבסיס כזה נקבל מהגדרה ש-\(A\) ו-\(C\) הם הערכים העצמיים.
3 כלל השרשרת
3.1 הגדרות
אין הגדרות בפרק זה.
\(\clubsuit\)
תזכורת: בקובץ ההגדרות ציינתי שהגדרת הדיפרנציאביליות עובדת באותה צורה גם עבור פונקציות מהצורה \(f:\MKreal^{n}\rightarrow\MKreal^{m}\) כאשר \(m>1\) (כמובן שגם הטווח של הדיפרנציאל צריך להשתנות בהתאם); ואז הגדרת הדיפרנציאביליות של פונקציות מהצורה \(f:\MKreal^{n}\rightarrow\MKreal^{m}\) כוללת בתוכה גם את הגדרת הדיפרנציאביליות שראינו עבור פונקציות מהצורה \(f:\MKreal^{n}\rightarrow\MKreal\) וגם את הגדרת הגזירות של מסילות, ומוסיפה על אלו את כל הפונקציות שעבורן \(n,m>1\). כעת אני רוצה להשתמש בידע הזה כדי לתת כאן את כלל השרשרת בצורתו המלאה (עבור פונקציות מ-\(\MKreal^{n}\) ל-\(\MKreal^{m}\)) וזאת למרות שלא למדנו אותו בכיתה, לאחר מכן נראה ששתי הגרסאות של כלל השרשרת שלמדנו בכיתה הן בעצם מקרה פרטי של כלל השרשרת המלא.
\(\clubsuit\)
נזכור שישנו איזומורפיזם בין מרחב ההעתקות הליניאריות ממרחב וקטורי אחד למשנהו (במקרה זה \(\MKhom\left(\MKreal^{n},\MKreal^{m}\right)\) ו-\(\MKhom\left(\MKreal^{m},\MKreal^{k}\right)\)) לבין מרחב המטריצות בגודל המתאים (במקרה זה \(M_{m\times n}\left(\MKreal\right)\) ו-\(M_{k\times m}\left(\MKreal\right)\) בהתאמה) ושהרכבת העתקות ליניאריות שקולה לכפל המטריצות המייצגות שלהן, א"כ כלל השרשרת אומר שמתקיים (\(E\) הוא הבסיס הסטנדרטי):\[
\left[D_{g\circ f}\left(a\right)\right]_{E}=\left[D_{g}\left(f\left(a\right)\right)\right]_{E}\cdot\left[D_{f}\left(a\right)\right]_{E}
\]כאן כבר קל לראות שכלל השרשרת הנ"ל מכליל את כלל השרשרת שלמדנו באינפי'1שהרי באינפי'1ההעתקות הליניאריות המתאימות19ראו את האינטואיציה שלפני הגדרת הדיפרנציאביליות (בקובץ ההגדרות כמובן). מיוצגות ע"י מטריצה מגודל \(1\times1\) ולכן כפל המטריצות הוא בעצם כפל בשדה \(\MKreal\), כלומר שני הביטויים הבאים שקולים:\[\begin{align*}
\left[D_{g\circ f}\left(a\right)\right]_{E} & =\left[D_{g}\left(f\left(a\right)\right)\right]_{E}\cdot\left[D_{f}\left(a\right)\right]_{E}\\
\left(g\circ f\right)'\left(a\right)=D_{g\circ f}\left(a\right) & =D_{g}\left(f\left(a\right)\right)\cdot D_{f}\left(a\right)=g'\left(f\left(a\right)\right)\cdot f'\left(a\right)
\end{align*}\]
\(\clubsuit\)
נשים לב לכך ש-\(x\) ו-\(y\) מגדירות יחדיו פונקציה \(h:\MKreal\rightarrow\MKreal^{2}\) ע"י:\[
h\left(t\right)=\begin{pmatrix}x\left(t\right)\\
y\left(t\right)
\end{pmatrix}
\]כלומר \(g\) היא בעצם \(f\circ h\). נזכר שראינו בפרק שעסק במסילות שעובדת היותן של \(x\) ו-\(y\) גזירות ב-\(t_{0}\) גוררת את גזירותה של \(h\) ב-\(t_{0}\) וכפי שהזכרנו לעיל הגזירות שראינו כשעסקנו במסילות היא בעצם דיפרנציאביליות של פונקציות מ-\(\MKreal\) ל-\(\MKreal^{n}\), א"כ \(h\) דיפרנציאבילית ב-\(t_{0}\) ולכן מכלל השרשרת המלא נובע שמתקיים:\[
\left[D_{f\circ h}\left(t_{0}\right)\right]_{E}=\left[D_{f}\left(h\left(t_{0}\right)\right)\right]_{E}\cdot\left[D_{h}\left(t_{0}\right)\right]_{E}
\]והרי מהגדרה מתקיים20נזכור שהגרדיאנט הוא בעצם המשוחלפת של המטריצה המייצגת.:\[\begin{align*}
\left[D_{f}\left(h\left(t_{0}\right)\right)\right]_{E} & =\left[\begin{array}{cc}
f_{x}'\left(h\left(t_{0}\right)\right) & f_{y}'\left(h\left(t_{0}\right)\right)\end{array}\right]\\
& =\left[\begin{array}{cc}
f_{x}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix} & f_{y}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\end{array}\right]\\
\left[D_{h}\left(t_{0}\right)\right]_{E} & =\begin{bmatrix}x'\left(t_{0}\right)\\
y'\left(t_{0}\right)
\end{bmatrix}
\end{align*}\]\[
\Rightarrow\left[D_{f\circ h}\left(t_{0}\right)\right]_{E}=\left[\begin{array}{cc}
f_{x}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix} & f_{y}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\end{array}\right]\cdot\begin{bmatrix}x'\left(t_{0}\right)\\
y'\left(t_{0}\right)
\end{bmatrix}=\left[f_{x}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot x'\left(t_{0}\right)+f_{y}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot y'\left(t_{0}\right)\right]
\]ומכיוון שהאגפים הקיצוניים הם בעצם מטריצות מגודל \(1\times1\) נקבל:\[
g'\left(t_{0}\right)=\left(f\circ h\right)'\left(t_{0}\right)=D_{f\circ h}\left(t_{0}\right)=f_{x}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot x'\left(t_{0}\right)+f_{y}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot y'\left(t_{0}\right)
\]
\(\clubsuit\)
הגרסה הזו היא בעצם הגרסה הקודמת בתחפושת, להלן ההסבר לכך. תהיינה \(x_{1},x_{2},y_{1},y_{2}:\MKreal\rightarrow\MKreal\) המוגדרות ע"י (לכל \(s,t\in\MKreal\)):\[\begin{align*}
x_{1}\left(s\right) & :=x\begin{pmatrix}s\\
t_{0}
\end{pmatrix} & y_{1}\left(s\right) & :=y\begin{pmatrix}s\\
t_{0}
\end{pmatrix}\\
x_{2}\left(t\right) & :=x\begin{pmatrix}s_{0}\\
t
\end{pmatrix} & y_{2}\left(t\right) & :=y\begin{pmatrix}s_{0}\\
t
\end{pmatrix}
\end{align*}\]מקיומן של הנגזרות החלקיות של \(x\) ו-\(y\) ב-\(P_{0}\) נובע ש-\(x_{1},x_{2},y_{1},y_{2}\) גזירות ב-\(s=s_{0}\) וב-\(t=t_{0}\) בהתאמה ומתקיים:\[\begin{align*}
x_{1}'\left(s_{0}\right) & :=x_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & y_{1}'\left(s_{0}\right) & :=y_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\\
x_{2}'\left(t_{0}\right) & :=x_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & y_{2}'\left(t_{0}\right) & :=y_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}
\end{align*}\]נגדיר שתי פונקציות חדשות \(g_{1},g_{2}:\MKreal\rightarrow\MKreal\) ע"י (לכל \(s,t\in\MKreal\)):\[\begin{align*}
g_{1}\left(s\right) & :=g\begin{pmatrix}s\\
t_{0}
\end{pmatrix}=f\begin{pmatrix}x_{1}\left(s\right)\\
y_{1}\left(s\right)
\end{pmatrix}\\
g_{2}\left(t\right) & :=g\begin{pmatrix}s_{0}\\
t
\end{pmatrix}=f\begin{pmatrix}x_{2}\left(t\right)\\
y_{2}\left(t\right)
\end{pmatrix}
\end{align*}\]ומהגרסה הקודמת נובע שמתקיים:\[\begin{align*}
g_{1}'\left(s_{0}\right) & =f_{x}'\begin{pmatrix}x_{1}\left(s_{0}\right)\\
y_{1}\left(s_{0}\right)
\end{pmatrix}\cdot x_{1}'\left(s_{0}\right)+f_{y}'\begin{pmatrix}x_{1}\left(s_{0}\right)\\
y_{1}\left(s_{0}\right)
\end{pmatrix}\cdot y_{1}'\left(s_{0}\right)\\
& =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\\
g_{2}'\left(t_{0}\right) & =f_{x}'\begin{pmatrix}x_{2}\left(t_{0}\right)\\
y_{2}\left(t_{0}\right)
\end{pmatrix}\cdot x_{2}'\left(t_{0}\right)+f_{y}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot y_{2}'\left(t_{0}\right)\\
& =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}
\end{align*}\]מהגדרת \(g_{1}\) ו-\(g_{2}\) נקבל שאם \(g_{1}\) גזירה ב-\(s_{0}\) אז הנגזרת החלקית \(g_{s}'\left(P_{0}\right)\) קיימת ושווה לה וכמו כן אם \(g_{2}\) גזירה ב-\(t_{0}\) אז הנגזרת החלקית \(g_{t}'\left(P_{0}\right)\) קיימת ושווה לה, כלומר:\[\begin{align*}
g_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =g_{1}'\left(s_{0}\right)=f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\\
g_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =g_{2}'\left(t_{0}\right)=f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}
\end{align*}\]
\(\clubsuit\)
אם \(x\) ו-\(y\) הן פונקציות המקבלות שלושה משתנים (וממילא גם \(g\) תהיה כזו) נקבל באותה דרך שמתקיים:\[\begin{align*}
g_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\\
g_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\\
g_{u}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{u}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{u}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}
\end{align*}\]כמובן שאפשר להמשיך לארבעה משתנים ויותר וכמו כן גם ניתן להגדיל את מספר המשתנים שמקבלת \(f\) אלא שאז נצטרך להוסיף מחוברים ולא שוויונות.
משפט. כלל השרשרת המלא תהיינה \(f:A\rightarrow B\) ו-\(g:B\rightarrow\MKreal^{k}\) (כאשר \(A\subseteq\MKreal^{n}\) ו-\(B\subseteq\MKreal^{m}\)) כך ש-\(f\) דיפרנציאבילית בנקודה \(a\in A\) ו-\(g\) דיפרנציאבילית ב-\(f\left(a\right)\), \(g\circ f\) דיפרנציאבילית ב-\(a\) ומתקיים:\[
D_{g\circ f}\left(a\right)=D_{g}\left(f\left(a\right)\right)\circ D_{f}\left(a\right)
\]
בעמודים הבאים נראה כיצד גם שתי הגרסאות של כלל השרשרת שלמדנו בכיתה הן בעצם מקרה פרטי של כלל השרשרת הנ"ל.
משפט 3.1. כלל השרשרת - גרסה ראשונה תהיינה \(x,y:\MKreal\rightarrow\MKreal\) כך ש-\(x\) ו-\(y\) גזירות בנקודה \(t_{0}\in\MKreal\) ותהא \(f:\MKreal^{2}\rightarrow\MKreal\) פונקציה דיפרנציאבילית בנקודה \(\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\), נגדיר \(g:\MKreal\rightarrow\MKreal\) ע"י \(g\left(t\right):=f\begin{pmatrix}x\left(t\right)\\
y\left(t\right)
\end{pmatrix}\) (לכל \(t\in\MKreal\)); \(g\) גזירה ב-\(t_{0}\) ומתקיים:\[
g'\left(t_{0}\right)=f_{x}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot x'\left(t_{0}\right)+f_{y}'\begin{pmatrix}x\left(t_{0}\right)\\
y\left(t_{0}\right)
\end{pmatrix}\cdot y'\left(t_{0}\right)
\]
משפט 3.2. כלל השרשרת - גרסה שנייה תהיינה \(x,y:\MKreal^{2}\rightarrow\MKreal\) כך שהנגזרות החלקיות שלהן קיימות בנקודה \(P_{0}=\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\) ותהא \(f:\MKreal^{2}\rightarrow\MKreal\) פונקציה דיפרנציאבילית בנקודה \(\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\), נגדיר פונקציה \(g:\MKreal^{2}\rightarrow\MKreal\) ע"י \(g\begin{pmatrix}s\\
t
\end{pmatrix}:=f\begin{pmatrix}x{s \choose t}\\
y{s \choose t}
\end{pmatrix}\) (לכל \(\begin{pmatrix}s\\
t
\end{pmatrix}\in\MKreal^{2}\)); הנגזרות החלקיות של \(g\) ב-\(P_{0}\) קיימות ומתקיים:\[\begin{align*}
g_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{s}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}\\
g_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix} & =f_{x}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot x_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}+f_{y}'\begin{pmatrix}x\left(P_{0}\right)\\
y\left(P_{0}\right)
\end{pmatrix}\cdot y_{t}'\begin{pmatrix}s_{0}\\
t_{0}
\end{pmatrix}
\end{align*}\]
3.2 פונקציה סתומה
דוגמה. ָהקבוצה \(C:=\left\{ \left(x,y\right)\in\MKreal^{2}\mid x^{2}+y^{2}=1\right\} \) המהווה את מעגל היחידה אינה יכולה להיות גרף של פונקציה אך עדיין היינו רוצים לדבר על המשיק לקבוצה בנקודה על המעגל; הרעיון הוא להגדיר פונקציה \(F:\MKreal^{2}\rightarrow\MKreal\) ע"י \(f\left(x,y\right)=x^{2}+y^{2}-1\) ואז לכל \(\left(x,y\right)\in C\) מתקיים \(f\left(x,y\right)=0\), כלומר \(C\) היא קו הגובה \(0\) של \(f\), כעת לכל נקודה \(c:=\left(x_{0},y_{0}\right)\in C\) קיימת סביבה מלאה שלה כך שקיימת פונקציה \(y:B_{r}\left(c\right)\rightarrow\MKreal\) המוגדרת ע"י \(y\left(x\right):=\MKsign\left(y_{0}\right)\cdot\sqrt{1-x^{2}}\). א"כ בסביבה זו מתקיים \(f\left(x,y\right)=f\left(x,y\left(x\right)\right)\) ואחרי שנגדיר \(g\left(x\right):=f\left(x,y\left(x\right)\right)\) בסביבה זו (נשים לב שמהגדרה \(g\) היא פונקציית האפס) נקבל מכלל השרשרת שמתקיים:\[
0=g'\left(x\right)=f_{x}'\begin{pmatrix}x_{0}\\
y\left(x_{0}\right)
\end{pmatrix}\cdot1+f_{y}'\begin{pmatrix}x_{0}\\
y\left(x_{0}\right)
\end{pmatrix}\cdot y'\left(x_{0}\right)
\]וסוף סוף מופיע הביטוי המיוחל \(y'\left(x_{0}\right)\) במשוואה שממנה ניתן לחלץ אותו שכן אם \(f_{y}'\left(x_{0},y\left(x_{0}\right)\right)\neq0\) אז מתקיים:\[
y'\left(x_{0}\right)=-\frac{f_{x}'\left(x_{0},y\left(x_{0}\right)\right)}{f_{y}'\left(x_{0},y\left(x_{0}\right)\right)}
\]
\(\clubsuit\)
הרעיון הוא כמובן שאנו מצטמצמים לסביבה מספיק קטנה של הנקודה כך שבה \(C\cap B_{r}\left(c\right)\) כן מהווה גרף של פונקציה.
\(\clubsuit\)
אנו מגדירים את \(f\) ולכן נגדיר אותה כך שיתקיים את התנאי \(f\left(P\right)=0\) לכל \(P\in U_{1}\), הדרך לעשות זאת היא לבודד את \(0\) באחד האגפים של משוואת הפונקציה הסתומה ואז להגדיר את \(f\) ע"פ האגף השני21זה מה שעשינו בדוגמה שלעיל..
\(\clubsuit\)
בדוגמה שלעיל ובכלל בפונקציות בשתי משתנים ישנה אינטואיציה חזקה מאד לנוסחה הנ"ל, שימו לב שהגרדיאנט של \(f\) ב-\(c\)22\(f\) אכן דיפרנציאבילית ב-\(c\). הוא:\[
\overrightarrow{\nabla}f\begin{pmatrix}x_{0}\\
y_{0}
\end{pmatrix}=\begin{bmatrix}f_{x}'\left(x_{0},y\left(x_{0}\right)\right)\\
f_{y}'\left(x_{0},y\left(x_{0}\right)\right)
\end{bmatrix}
\]ולכן אחד הווקטורים המאונכים לו23כל השאר הם כפל בסקלר כמובן. הוא:\[
\begin{bmatrix}f_{y}'\left(x_{0},y\left(x_{0}\right)\right)\\
-f_{x}'\left(x_{0},y\left(x_{0}\right)\right)
\end{bmatrix}
\]והשיפוע של ישר הנפרש ע"י וקטור זה הוא בדיוק:\[
-\frac{f_{x}'\left(x_{0},y\left(x_{0}\right)\right)}{f_{y}'\left(x_{0},y\left(x_{0}\right)\right)}
\]אם נזכור שהמשיק לקו הגובה מאונך לגרדיאנט נבין למה זה קרה.
משפט 3.3. משפט הפונקציה הסתומה תהא \(f:\MKreal^{n}\rightarrow\MKreal\) פונקציה המוגדרת בסביבה \(U_{1}\) נקודה \(\left(x_{1},x_{2},\ldots,x_{n}\right)\in\MKreal^{n}\) המקיימת את התנאים הבאים:
\(f\left(P\right)=0\) לכל \(P\in U_{1}\).
כל הנגזרות החלקיות של \(f\) מוגדרות ורציפות ב-\(U_{1}\).
כל הנגזרות החלקיות של \(g\) קיימות ב-\(\left(x_{1},x_{2},\ldots,x_{n-1}\right)\) ולכל \(n-1\geq i\in\MKnatural\) מתקיים:\[
D_{i}g\left(x_{1},x_{2},\ldots,x_{n-1}\right)=-\frac{D_{i}f\left(x_{1},x_{2},\ldots,x_{n}\right)}{D_{n}f\left(x_{1},x_{2},\ldots,x_{n}\right)}
\]
קיימת סביבה \(U_{2}\) של \(b:=\left(x_{1},x_{2},\ldots,x_{n-1}\right)\in\MKreal^{n-1}\) וקיימת פונקציה יחידה \(g:U_{2}\rightarrow\MKreal\) המקיימת את המשוואה \(f\left(y_{1},y_{2},\ldots,y_{n-1},g\left(y_{1},y_{2},\ldots,y_{n-1}\right)\right)=0\) ובעלת התכונות הבאות:
4 חזרה לנקודות קיצון
4.1 הגדרות
אין הגדרות בפרק זה.
\(\clubsuit\)
עד כה ראינו כיצד ניתן למצוא ולמיין נקודות קריטיות של פונקציות כשהן מוגדרות על קבוצות פתוחות (או קומפקטיות ששפתן אינה הקבוצה כולה) אך מה נעשה כשהפונקציה מוגדרת על קבוצה קומפקטית שכולה שפה (עקומה חד-ממדית במרחב)?
\(\clubsuit\)
הפתרון לשאלה שבהערה הקודמת הוא להרחיב את תחום הפונקציה לקבוצה פתוחה ואז כל נקודת קיצון שלה תצטרך לקיים את משפט כופלי לגראנז', לאחר מכן נמיין את הנקודות כרגיל.
\(\clubsuit\)
כמו במשפט הפונקציה הסתומה גם כאן נגדיר את \(g\) ע"פ האילוץ שקיבלנו כך שתקיים שקבוצת האילוץ היא בדיוק \(\left\{ P\in D\mid g\left(P\right)=0\right\} \).
\(\clubsuit\)
העובדה ש-\(P_{0}\) היא נקודה קריטית של \(h\) אומרת שלכל \(n\geq i\in\MKnatural\) מתקיים24ה-\(\lambda\) פה היא הנגדית של ה-\(\lambda\) מהניסוח הקודם.:\[\begin{align*}
0 & =D_{i}h\left(P_{0}\right)=D_{i}f\left(P_{0}\right)+\lambda\cdot D_{i}g\left(P_{0}\right)\\
\Longleftrightarrow & D_{i}f\left(P_{0}\right)=-\lambda\cdot D_{i}g\left(P_{0}\right)
\end{align*}\]נשאר רק לחלק ב-\(-D_{i}g\left(P_{0}\right)\).
משפט 4.1. משפט כופלי לגראנז'25ערך בוויקיפדיה: ז'זף-לואי לגראנז'. תהיינה \(f,g:D\rightarrow\MKreal\) (כאשר \(D\subseteq\MKreal^{n}\) קבוצה פתוחה) פונקציות בעלות נגזרות חלקיות רציפות ב-\(D\), אם \(P_{0}\in D\) היא נקודת קיצון כללית של \(f\) כשהיא מצומצמת לקבוצה \(\left\{ P\in D\mid g\left(P\right)=0\right\} \), וגם \(\overrightarrow{\nabla}g\left(P_{0}\right)\neq0\) אז קיימת \(\lambda\in\MKreal\) כך שמתקיים:\[
\overrightarrow{\nabla}f\left(P_{0}\right)=\lambda\cdot\overrightarrow{\nabla}g\left(P_{0}\right)
\]אותה \(\lambda\) היא:\[
\lambda=\frac{D_{i}f\left(P_{0}\right)}{D_{i}g\left(P_{0}\right)}
\]עבור כל אחת מהקואורדינטות שעבורן \(D_{i}g\left(P_{0}\right)\neq0\).
משפט 4.2. דרך שקולה לבטא את משפט כופלי לגראנז' תהיינה \(f,g:D\rightarrow\MKreal\) (כאשר \(D\subseteq\MKreal^{n}\) קבוצה פתוחה) פונקציות בעלות נגזרות חלקיות רציפות ב-\(D\), אם \(P_{0}\in D\) היא נקודת קיצון כללית של \(f\) כשהיא מצומצמת לקבוצה \(\left\{ P\in D\mid g\left(P\right)=0\right\} \)וגם \(\overrightarrow{\nabla}g\left(P_{0}\right)\neq0\) אז \(P_{0}\) היא נקודה קריטית של הפונקציה \(h:D\times\MKreal\rightarrow\MKreal\) המוגדרת ע"י \(h\left(x_{1},x_{2},\ldots,x_{n},\lambda\right):=f\left(x_{1},x_{2},\ldots,x_{n}\right)+\lambda\cdot g\left(x_{1},x_{2},\ldots,x_{n}\right)\).
משפט 4.3. הכללה של משפט כופלי לגראנז' תהיינה \(f,g_{1},g_{2},\ldots,g_{k}:D\rightarrow\MKreal\) (כאשר \(D\subseteq\MKreal^{n}\) קבוצה פתוחה) פונקציות בעלות נגזרות חלקיות רציפות ב-\(D\), אם ש-\(P_{0}\in D\) היא נקודת קיצון כללית של \(f\) כשהיא מצומצמת לקבוצה\[
\left\{ \begin{array}{c|c}
P\in D & \begin{cases}
g_{1}\left(P\right)=0\\
g_{2}\left(P\right)=0\\
\vdots\\
g_{1}\left(P\right)=0
\end{cases}\end{array}\right\}
\]